Appunti utili per l'esame di - Retorica e Scrittura per i Nuovi Media - in cui vengono definiti i principali modelli di catalogazione della conoscenza sul web (tramite tassonomie, faceted classification e folksonomy) e i vari metodi di ricerca delle informazioni (Berrypicking).
Organizzare la Conoscenza
di Dario Gemini
Appunti utili per l'esame di - Retorica e Scrittura per i Nuovi Media - in cui
vengono definiti i principali modelli di catalogazione della conoscenza sul web
(tramite tassonomie, faceted classification e folksonomy) e i vari metodi di
ricerca delle informazioni (Berrypicking).
Università: Università degli Studi di Roma La Sapienza
Facoltà: Lettere e Filosofia
Corso: Filosofia
Esame: Retorica e Scrittura per i Nuovi Media
Titolo del libro: Organizzare la Conoscenza
Autore del libro: Claudio Gnoli ed altri
Editore: Tecniche Nuove
Anno pubblicazione: 20061. Organizzare il sapere: i sistemi di classificazione
Si vuole studiare il problema dell'organizzazione dei contenuti. Organizzare la conoscenza è indispensabile
per poterla usare. L’origine della conoscenza è cosa antica.
Lo fece Aristotele dando i nomi alle varie discipline, raggruppando i campi del sapere in tre classi: teoretica
(scienza del mondo così com’è), pratica (discipline volte a realizzare qualcosa), poetica (arti e letteratura).
Bacon distinguerà le scienze a seconda delle facoltà conoscitive che le producono. La grande enciclopedia
illuminista è un prototipo di ipertesto.
Linneo nel 1750 introduce un sistema di classificazione: con un nome latino sono distinti il genere e la
specie (es.: panthera leo). I generi divisi in ordini, gli ordini in classi, le classi in tipi. La tassonomia
numerica del 73 si usa per raggruppare organismi con dendrogrammi, alberi che tengono conto dell’origine
comune.
C’è poi la tassonomia cladistica, che raggruppa solo in base alle caratteristiche comuni.
A fine '800 Dewey inventa un sistema ingegnoso, suddividendo ogni disciplina in sottoclassi e così via. Es:
800 è la letteratura in genere, 810 la letteratura americana, 851 la poesia italiana. Il sistema va da 000 a 999
distinguendo 1000 classi diverse. Si usano anche i decimali. Il sistema si chiama CDD o classificazione
decimale di Dewey, ancora usatissima. Le etichette si danno ai libri e non agli scaffali. È un collocazione
relativa, e si può usare anche per il web. Da Otlet e Lafontaine nasce una cugina della CDD (o DDC), la
classificazione decimale universale, che utilizza altri segni d punteggiatura. Altro schema è la LCC o
Library of Congress Classification, che usa lettere dell'alfabeto. La biblioteca del congresso degli Stati
Uniti ha anche diffuso il suo sistema alfabetico per indicizzare i soggetti trattati nei libri. Si consolida così l’
LCSH o library of congress subject headings, il più importante soggettario del mondo.
Negli anni '30 un certo Ranganathan, un matematico indiano, concepisce un tecnica per descrivere il
contenuto di un documento: l'analisi a faccette. Si scompone l'argomento in alcuni suoi aspetti componenti,
secondo certe regole, per poi ricomporlo in un codice combinato. Formula cinque leggi della
biblioteconomia: i libri van usati - a ogni lettore il suo libro - e viceversa - non far perder tempo al lettore -
la biblioteca come organismo. Lo schema nel quale sperimentò le sue tecniche è la classificazione colon
(CC) che ebbe diffusione limitata. Alcuni studiosi inglesi lo valorizzano e formano un circolo dedito alla
ricerca sulla classificazione bibliografica, il CRG. Il CRG sviluppa l'analisi a faccette. I suoi membri si
muovono poi in diverse direzioni: Farradane sviluppa l'indicizzazione relazionale, Derek Austin
sviluppa un sistema di indicizzazione a faccette, il PRECIS.
Di recente la tedesca Dahlberg ha sviluppato un teoria dei concetti, gli elementi a partire dei quali si
costruisce un schema semantico. Ha proposto un suo schema, l'ICC, information coding classification.
Dario Gemini Sezione Appunti
Organizzare la Conoscenza Oggi nel web si usa spesso il termine ontologia in riferimento all'ambito di rappresentazione della
conoscenza.
Dario Gemini Sezione Appunti
Organizzare la Conoscenza 2. Le forme e gli elementi della conoscenza: come classificarli
Il cervello e i sensi colgono strutture stabili che si ripetono, dette Gestalt o forme. Così identifichiamo
oggetti concreti ma anche relazioni e situazioni astratte che si ripetono. Questi diventano concetti, gli
elementi costitutivi della conoscenza. Un concetto è definito da un insieme di caratteristiche; è un'unità di
conoscenza composta dall'unione di elementi singoli di conoscenza. Una campana è un concetto (recipiente
concavo, utilizzata come strumento sonoro, normalmente di metallo...). Per condividere la conoscenza le
persone esprimono i concetti con dei termini. Molti termini coincidono con singole parole, altri no. I concetti
si possono organizzare in diverse strutture.
Individuata una serie di concetti, come li disponiamo in un ordine significativo? Secondo Ranganathan per
organizzare la conoscenza va individuata una successione, che dipende comunque da quello che vogliamo
fare. Identifica otto principi che si possono applicare in sequenza:
- sequenza nel tempo
- nell'evoluzione
- contiguità spaziale
- misura quantitativa
- complessità
- successione canonica
- garanzia bibliografica
- sequenza alfabetica.
I primi cinque riguardano caratteristiche intrinseche agli oggetti da organizzare (i più antichi precedono i
recenti ecc). Esempi: se dobbiamo disporre in ordine tutti i laghi europei partiamo dal terzo principio e
scegliamo ad es. da ovest ad est. Gli ultimi tre principi riguardano situazioni contingenti esterne agli oggetti.
Molti siti web ad es. usano l'ordine alfabetico per elencare le loro classi.
Quando nel nostro PC c'è confusione creiamo cartelle per raggruppare documenti. Si crea così una
gerarchia. Le cartelle qui le chiamiamo classi in cui raggruppare unità di conoscenza affini. Qui partiamo
dal basso verso l'alto (approccio a posteriori) raggruppando singole unità in classi. Se le classi aumentano le
raggruppiamo in cartelle di ordine superiore. L'approccio dal basso verso l'alto rispetta il principio della
garanzia bibliografica: per un gruppo d oggetti creiamo una classe solo quando diventano abbastanza
numerosi. Un approccio a priori, ossia dall'alto verso il basso, comincia invece dall'immaginare dall'inizio
tutte le conoscenze da organizzare e come suddividerle. Sono due approcci che spesso coesistono e son
entrambi utili. Avendo tante classi possiamo formare un albero gerarchico contrassegnando ogni suo nodo
con una notazione decimale. La suddivisione gerarchica è una pratica che si trova già nel libro delle
mutazioni cinese, dove si dice che l'unità del mondo si compone di due parti, la terra (tratto spezzato -
quiete) e il cielo (tratto continuo - movimento). Terra e cielo poi si suddividono a loro volta. Sostituendo i
tratti con le cifre si arriva al diagramma dei 64 esagrammi, ottenendo una classificazione binaria che
funziona in modo analogo alla DDC - classificazione decimale di Dewey:
Dario Gemini Sezione Appunti
Organizzare la Conoscenza 0 terra, quiete
00 morbidezza
000 acqua
001 fuoco
01 durezza....
Logicamente le gerarchie esprimono relazioni generiche, ossia quelle tra un genere di oggetti e le sue
possibili specie. Per controllare se la gerarchia generi-specie è corretta possiamo utilizzare la prova del
"tutti-qualche": la relazione è generica se si può dire che tutti gli abeti sono conifere e che qualche conifera è
un abete. Ci sono poi relazioni quasi generiche: la gerarchia vale solo in particolari circostanze ma non fa
parte dell'essenza degli oggetti (se Luca sale su un treno appartiene alla classe dei passeggeri, solo fino a
quando non scende. Non è passeggero nell'essenza). Passeggeri – Luca = relazione quasi generica. Genere
umano – Luca = relazione generica. Il CRG ha individuato un altro tipo di relazione, la relazione partitiva
(il manubrio è parte di un intero, la bicicletta). Un abete è invece un TIPO di conifera. comunque gli oggetti
composti di parti formano sistemi più o - complessi. Le parti di un sistema possono poi interagire in modo
più o meno stretto. Sistemi le cui parti non son collegate in modo stretto si dicono aggregati (lupi di un
branco). Quando invece si perde l'identità delle parti si ottiene un integrato. Gli integrati in natura posson
essere disposti in un serie di livelli di integrazione, dagli atomi alle società.
In ambiente informatico si parla spesso di categorie = le classi di un schema, soprattutto quelle principali.
Definizione di categoria:
tipologia generale in cui posson venire raggruppati i concetti da un punto di vista logico. Es. le categorie
familiari sono: oggetto inanimato, animato, azione, proprietà ecc.
Aristotele individua il più classico insieme di categorie: sostanza, quantità, qualità, relazione, azione, patire,
luogo, tempo, avere, stare. Relazionando concetti appartenenti a categorie diverse si ottengono concetti
composti. I singoli concetti son chiamati talvolta isolati (madras = isolato; agricoltura : madras è un
composto). Quasi tutti i concetti appartengono a certe categorie e i loro composti son formati da
combinazioni di queste. Es. se parliamo di agricoltura incontreremo sempre categorie come piante coltivate,
fasi della coltivazione ecc.
Le categorie tipiche di una certa disciplina furono chiamate da Ranganathan faccette, dall’inglese facet =
aspetto. Così il contenuto di un documento si può descrivere come un combinazione di faccette. Ad esempio
possiamo chiamare le faccette dell'agricoltura: piante-organi-fasi-stagioni-regioni-strumenti. Quindi
analizzando i concetti di una disciplina si determinano le faccette. Possiamo ricondurre le faccette specifiche
di una disciplina a categorie fondamentali che hanno a che fare con le categorie generali della realtà. R
scelse queste 5 categorie fondamentali: Personalità (es. piante) -- Materia o proprietà (es. organi - parti di un
pianta)-- Energia (fasi) -- Spazio (stagioni)-- Tempo (regioni). E gli strumenti? secondo Ranganathan alcune
Dario Gemini Sezione Appunti
Organizzare la Conoscenza